Saltar al contenido principal

02.04 - Distribuciones de probabilidad

Modelos de Simualción


1. Distribución Uniforme (Continua)

Características:

  • Todos los eventos tienen la misma probabilidad de ocurrir.
  • Se define por dos parámetros: a (límite inferior) y b (límite superior).

Fórmula:

f(x)={1bapara axb0en otro casof(x) = \begin{cases} \frac{1}{b - a} & \text{para } a \le x \le b \\ 0 & \text{en otro caso} \end{cases}

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import uniform

a = 0
b = 10
x = np.linspace(a, b, 100)
y = uniform.pdf(x, a, b - a)

plt.plot(x, y)
plt.xlabel("x")
plt.ylabel("f(x)")
plt.title("Distribución Uniforme")
plt.show()

2. Distribución Normal (Gaussiana)(Continua)

Características:

  • Es la distribución más utilizada en estadística.
  • Se define por dos parámetros: μ\mu (media) y σ\sigma (desviación estándar).
  • Es simétrica alrededor de su media.
  • El 68% de los datos se encuentran a una desviación estándar de la media.

Fórmula: f(x;μ,σ)=1σ2πe(xμ)22σ2f(x; \mu, \sigma) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}

  • f(x;μ,σ)f(x; \mu, \sigma) es la función de densidad de probabilidad de la distribución normal.
  • xx es una variable aleatoria continua.

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

mu = 0
sigma = 1
x = np.linspace(mu - 4 * sigma, mu + 4 * sigma, 100)
y = norm.pdf(x, mu, sigma)

plt.plot(x, y)
plt.xlabel("x")
plt.ylabel("f(x)")
plt.title("Distribución Normal")
plt.show()

3.Distribución Exponencial (Continua)

Características:

Modela el tiempo entre eventos en un proceso de Poisson. Se define por un parámetro: λ (tasa). Fórmula:

f(x;λ)={λeλxpara x00para x<0f(x; \lambda) = \begin{cases} \lambda e^{-\lambda x} & \text{para } x \ge 0 \\ 0 & \text{para } x < 0 \end{cases}
  • f(x;λ)f(x; \lambda) es la función de densidad de probabilidad de la distribución exponencial.
  • xx es una variable aleatoria continua.
  • λ\lambda es el parámetro de la distribución, que representa la tasa de ocurrencia de eventos.

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import expon

lambd = 1
x = np.linspace(0, 6, 100)
y = expon.pdf(x, scale=1 / lambd)

plt.plot(x, y)
plt.xlabel("x")
plt.ylabel("f(x)")
plt.title("Distribución Exponencial")
plt.show()

4. Distribución Binomial (Discreta)

Características:

  • Modela el número de éxitos en n ensayos independientes de Bernoulli.
  • Se define por dos parámetros: nn (número de ensayos) y pp (probabilidad de éxito).

Fórmula:

P(X=k)=(nk)pk(1p)nkP(X=k) = \binom{n}{k} p^k (1-p)^{n-k}

  • P(X=k)P(X=k) es la probabilidad de que ocurran kk éxitos en nn ensayos independientes.

  • (nk)\binom{n}{k} es el coeficiente binomial, que se calcula como n!k!(nk)!\frac{n!}{k!(n-k)!}.

  • (1p)(1-p) es la probabilidad de fracaso en cada ensayo.


import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import binom

n = 10
p = 0.5
x = np.arange(n + 1)
y = binom.pmf(x, n, p)

plt.plot(x, y, "o")
plt.xlabel("x")
plt.ylabel("f(x)")
plt.title("Distribución Binomial")
plt.show()

5. Distribución de Poisson (Discreta)

Características:

  • Modela el número de eventos que ocurren en un intervalo de tiempo o espacio fijo.
  • Se define por un parámetro: λ (tasa promedio de eventos).

Fórmula:

P(X=k)=eλλkk!P(X=k) = \frac{e^{-\lambda} \lambda^k}{k!}

  • P(X=k)P(X=k) es la probabilidad de que ocurran kk eventos en un intervalo de tiempo determinado.
  • λ\lambda es el parámetro de la distribución, que representa el número promedio de eventos por unidad de tiempo.
  • kk es el número de eventos que se espera que ocurran en el intervalo de tiempo.

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import poisson

lambd = 4
x = np.arange(poisson.ppf(0.001, lambd), poisson.ppf(0.999, lambd))
y = poisson.pmf(x, lambd)

plt.plot(x, y, "o")
plt.xlabel("x")
plt.ylabel("f(x)")
plt.title("Distribución de Poisson")
plt.show()

6. Distribución Gamma (Continua)

Características:

  • Modela el tiempo hasta que ocurren k eventos en un proceso de Poisson.

f(x;α,β)=xα1ex/ββαΓ(α)f(x; \alpha, \beta) = \frac{x^{\alpha-1} e^{-x/\beta}}{\beta^\alpha \Gamma(\alpha)}

  • f(x;α,β)f(x; \alpha, \beta) es la función de densidad de probabilidad de la distribución gamma.
  • xx es una variable aleatoria continua.
  • α\alpha y β\beta son los parámetros de forma y escala, respectivamente.
  • Γ(α)\Gamma(\alpha) es la función gamma de α\alpha, que se define como la integral de 0 a infinito de tα1etdtt^{\alpha-1} e^{-t} dt.

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import gamma

k = 2
theta = 1
x = np.linspace(0, 15, 100)
y = gamma.pdf(x, k, scale=theta)

plt.plot(x, y)
plt.xlabel("x")
plt.ylabel("f(x)")
plt.title("Distribución Gamma")
plt.show()

7. Distribución Beta (Continua)

Características:

  • Modela la distribución de probabilidad de una variable aleatoria en [0, 1].

Fórmula: f(x;a,b)=xa1(1x)b1B(a,b)f(x; a, b) = \frac{x^{a-1} (1-x)^{b-1}}{B(a,b)}

  • f(x;a,b)f(x; a, b) es la función de densidad de probabilidad de la distribución beta.
  • xx es una variable aleatoria continua entre 0 y 1.
  • aa y bb son los parámetros de forma de la distribución.
  • B(a,b)B(a, b) es la función beta, que se define como B(a,b)=Γ(a)Γ(b)Γ(a+b)B(a, b) = \frac{\Gamma(a) \Gamma(b)}{\Gamma(a+b)}.
  • Γ(a)\Gamma(a) es la función gamma de aa, que se define como la integral de 0 a infinito de ta1etdtt^{a-1} e^{-t} dt.

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import beta

alpha = 2
_beta = 5
x = np.linspace(0, 1, 100)
y = beta.pdf(x, alpha, _beta)

plt.plot(x, y)
plt.xlabel("x")
plt.ylabel("f(x)")
plt.title("Distribución Beta")
plt.show()

Ejemplos de aplicabilidad de distintas distribuciones

Distribución Uniforme (Continua)

  • Lanzar un dado justo: La probabilidad de que caiga cualquier número del 1 al 6 es igual (1/6).
  • Elegir un punto aleatorio en un segmento de línea: la probabilidad de que caiga en cualquier lugar del segmento es igual.

Distribución Normal (Gaussiana)

  • Alturas de personas: La mayoría de las personas tienen una altura cercana al promedio, mientras que hay menos personas muy altas o muy bajas.
  • Errores de medición: Los errores aleatorios en mediciones suelen seguir una distribución normal.
  • Puntajes de CI: Los puntajes de CI se distribuyen normalmente alrededor de un promedio de 100.

Distribución Exponencial

  • Tiempo entre llamadas a un centro de llamadas: La distribución exponencial puede modelar el tiempo entre llamadas consecutivas en un centro de llamadas.
  • Vida útil de un componente electrónico: La distribución exponencial puede representar la vida útil de ciertos componentes electrónicos que tienen una tasa de falla constante a lo largo del tiempo.

Distribución Binomial

  • Número de caras al lanzar una moneda n veces: La distribución binomial modela el número de éxitos (caras) en n lanzamientos de una moneda justa.
  • Encuestas de opinión: En una encuesta de opinión, la distribución binomial puede modelar el número de personas que responden "sí" a una pregunta específica.

Distribución de Poisson

  • Número de clientes que llegan a una tienda en una hora: La distribución de Poisson puede modelar la cantidad de clientes que llegan a una tienda en un intervalo de tiempo fijo.
  • Número de correos electrónicos recibidos en un día: La distribución de Poisson puede representar la cantidad de correos electrónicos que llegan a una bandeja de entrada durante un día.

Distribución Gamma

  • Tiempos de espera entre múltiples eventos en un proceso de Poisson: La distribución Gamma puede modelar el tiempo total de espera hasta que ocurren k eventos en un proceso de Poisson.
  • Tiempo de vida de ciertos productos: La distribución Gamma puede representar la vida útil de ciertos productos que tienen una tasa de falla variable a lo largo del tiempo.

Distribución Beta

  • Estimación de proporciones: La distribución Beta puede utilizarse para modelar la distribución de probabilidad de una proporción, como la tasa de conversión de un sitio web o la efectividad de un medicamento.
  • Modelado de incertidumbre en estimaciones: La distribución Beta puede representar la incertidumbre en las estimaciones basadas en datos limitados, como la probabilidad de éxito en ensayos clínicos.